ToppCell Atlas:单细胞分析中针对细胞类型的富集分析
希望所有的学徒,实习生,学员都能在生信技能树的舞台上绽放自己的光彩!
Welcome to ToppGene (cchmc.org)
这是一个神奇的网站,除了常规的基因富集分析,还能进行细胞类型的富集分析。
在做单细胞分析中,进行细胞分类时,偶尔会出现一些奇怪的亚群。
如图中箭头所指,内皮细胞被分成了两个群。我们想知道他们为何被分成两群。首先拿到两群各自的高表达基因。
Idents(sce) = sce$seurat_clusters
degs = FindMarkers(sce, ident.1 = 13)
degs %>%
arrange(desc(avg_log2FC)) %>%
rownames_to_column('gene') %>%
fwrite('./cl13_degs.csv')
degs = FindMarkers(sce, ident.1 = 4)
degs %>%
arrange(desc(avg_log2FC)) %>%
rownames_to_column('gene') %>%
fwrite('./cl4_degs.csv')
高表达基因如下:
C13:
CCL21 TFF3 MMRN1 FABP4 TFPI IGFBP7 TIMP3 TM4SF1 SDPR EFEMP1 CAV1 CLDN5 FLT4 ROBO4 ECSCR NR2F2 APP PGM5 THBD RAMP2 CD9 TIE1 APOLD1 FXYD6 CD59 LMO2 TGFBR2 PROX1 OAF SHC1 SPTBN1 TBX1 TRIOBP NR2F1 AKAP12 ITGB4 PPFIBP1 NRP2 EMP1 ELK3
C4:
ACKR1 AQP1 VWF PLVAP SPARCL1 CLU ADIRF IGFBP7 SPRY1 PECAM1 RAMP3 IGFBP4 NPDC1 HSPG2 EPAS1 HEG1 EMCN LIFR A2M CAV1 IFI27 ADGRL4 ENG TSPAN7 CD34 HYAL2 COL15A1 RAMP2 EDN1 CLEC14A MMRN2 PTRF CRIP2 EGFL7 PTPRB ECSCR CD59 APOLD1 IL1R1 ESAM
拿到高表达基因后,进入下面这个网站进行富集分析:
Welcome to ToppGene (cchmc.org)
这里我选取了前40个基因去进行富集分析,得到结果如下:
C13:
根据ToppCell Atlas
可知13群为淋巴管内皮细胞(lymphatic endothelial cells, LEC)
C4:
4群为血管内皮细胞(endothelial cells)
除此之外,图中21群被注释为Tissue_stem_cell。我也想看看它的真实身份是什么。继续上面的流程,得到:
NOTCH3 TAGLN ACTA2 C11ORF96 MYL9 IGFBP5 MCAM MYH11 IGFBP7 TPM2 MYLK SPARCL1 MT1E COL18A1 CALD1 RGS5 SPARC ADIRF TINAGL1 PDGFRB BGN MFGE8 NR2F2 NDUFA4L2 TPM1 COL4A2 MAP1B CPE EPAS1 TIMP3 CAV1 A2M MT1M ADAMTS1 COL6A1 COL6A2 COL4A1 MT1A SOD3 TBX2
根据富集的信息
可知21群是周细胞或者平滑肌细胞。